其他
讲座文稿:何为新风格:关于生成对抗网络与扩散模型的迷思 | 加密艺术与元宇宙NO.15
《加密艺术与元宇宙》系列讲座第十五期,我们邀请到艺术家方政作为主讲嘉宾,以“何为新风格:关于生成对抗网络与扩散模型的迷思 ”为题做主题分享,并邀请了杭州心识宇宙有限公司研究院院长,集智俱乐部核心作者,科学作家十三维,复旦大学哲学博士后,中国社会科学院副教授王志强作为讨论嘉宾,独立纪录片导演、艺术家、当代艺术摄影批评人袁园担任主持与三位嘉宾展开对话与讨论。
本文为讲座内容文稿,扫描下图二维码观看视频回放。
关于生成对抗网络与扩散模型的迷思
生成对抗网络和扩散模型;
概念延展;
技术伦理;
总结。
大家好,很高兴今天能有机会来参与这次的分享会,我不想将它作为讲座。
Generative Adversarial Networks, GAN
其实机器学习算法的理念很早就被提出了,在我们生活中也运用了很久。最开始的手写识别、汽车车牌号识别、人脸识别、行人识别、天网追查罪犯——但是它的工作重心——至少五年以前——都在识别和判断上,不太能够生成。它能够学得很好,能够理解哪个是水平,哪个是斑马线,哪个是自行车,但并不能生成一张高水平的、真实的自行车的图片。
这个网站thispersondoesnotexist.com,每一次刷新都会生成一张人脸。我相信无论怎么看都是一张真实的脸,而且真实得有点儿吓人,每个地方都非常和谐,不是拼贴,而是所有的细节都跟人的种族、性别、年龄高度吻合,而且照片的质感也非常好。这些图片就是用“GAN”生成的。这里主要用的是StyleGan,效果非常非常真实。
1) 既再现又表现,比如马蒂斯这类既有具体物象又有很强表现性的野兽派;
2)只再现不表现,比如新古典主义;
3)不再现只表现,比如抽象表现主义;
4)既不再现也不表现的风格,比如硬边抽象,这个经常被人忽略。
1)将莫奈的画变成了一张照片,或者是把一张照片处理成莫奈的风格;
2)将斑马变成马或者是将马变成斑马;
3)将美丽的夏天变成冬天,将冬天变成夏天;
4)将同一张照片变成莫奈、梵高、浮世绘的风格。
单纯的“阳光灿烂的下午”很有可能生成一张非常好看、非常温馨的午后街景等,但如果加入反向提示词(也就是不想要的东西)——美丽的画面,便会生成一个阳光明媚但并不美好的画面,比如战乱。
看一些细节:下面张截图来自上面左图最右边的部分,可以看到都是男性的名字,男性的名字会特别紧密,女性的名字会松散一点。
chat GPT:抄袭不能被看作过拟合,过拟合通常指的是机器学习模型在训练数据上表现良好,但在新数据上表现不佳的情况,抄袭是指使用其他的作品不给予适当的认可。
chat GPT:你说得对,在训练数据过少的情况下模型很容易陷入过拟合,人类的学习有类似的地方,如果学习量过少,参考的风格、内容过于单一,就会产生单一化思考或者模仿别人的情况,也就是所谓的“抄袭”。但是抄袭和过拟合也是有区别的,抄袭指的是不遵循道德和法律的行为,而过拟合则是模型在新数据上的表现不佳。
chat GPT:你说得对,当机器学习模型训练数据来源于单一的艺术家或者单一领域的作品,生成结果会偏向于这个领域或者这个艺术家的风格,有可能会出现模仿或抄袭的情况,这种情况下,模型的过拟合和抄袭是密切相关的。而这个问题可以通过增加训练数据的多样性和来源来解决,避免模型陷入过拟合和抄袭的局面。
嘉宾讨论
“许多世纪以来,人们为精神的厨房引进了一些节省劳力的“设备”——酒精、咖啡、烟草、镇定药,大麻等等——可是他们都很不完善,不断失灵,而且很容易使下厨的人受伤。二十世纪的文学创作与公元前二十世纪并没有多少差别:几乎一切依然需要手工完成。”
“大多数艺术家是真诚的,大多数艺术是拙劣的,虽然某些不真诚的作品也可以是很不错的。”
“为了使谬误减少到最低限度,一名诗人对正在写作中的作品进行内在审查时,应提交给一个审查团。它应该包括:一个敏感的独生子、一位特别务实的家庭主妇、一名逻辑学家、一位僧侣、一个无礼的小丑,甚至,也许还有训练新兵的军士,他粗鲁野蛮,满嘴脏话,厌恶别人,也被别人厌恶,认为一切诗歌都是垃圾。”
“在我模仿他的过程当中,我并未被引导去疏离自身。但那些词汇和感觉同我的距离又不至于近到抹处我的个人特点。如果说我是透过他的眼镜看世界,至少我意识到了自己的视觉疲劳。”
如果用信息熵或是最基本的柯氏复杂度(Kolmogorov complexity)来衡量,信息复杂度最低或者说信息量最少的就是这三种网络,因为它可以被最简短的语言描述出来。
但是(d)和(f)很多时候非常像,那么怎么识别出一个网络是真正的复杂网络呢?
对于传统的创作性绘画作品,第一位观众是作者,此时表达和接受是双向互动的。然而,机器作为作者既不能欣赏也不能理解。这正是方政老师提到的,机器无法理解毛发和肌肤质感的画面,只能捕捉到外在的元素。
“机器画”是一种制造,它通过引入新元素产生与过去截然不同的全新画面。因此,在某种程度上,它可以被视为创作,但这种创作来自一个不会思考、不会欣赏、不会理解的“作者”。将其视为艺术品需要依赖观众的单向艺术想象以及观众的知识积累,观众必须通过传统艺术史教育和艺术涉猎积累一定的知识,才能为一幅机器创作的作品赋予艺术价值。
艺术建立在具身性基础之上的背后是什么? 我们作为艺术的创作者、接受者、艺术的讨论者是有欲望的,有生命意志的。如果没有这样一种欲望性的肉身,很难真正去理解艺术。无论技术如何完美地将所有色彩、形式、图形、画面呈现,都不能构成当下语境中的艺术。这也是我对人工智能发展不特别乐观的基本原因。
首先,我想回应一下王志强老师,我的看法有点不同,可能我对人性更悲观一些。我忘记是谁说过一句话:“我们和星辰的尘埃是由同样的东西组成的”。从这个意义上,人和人工智能、人和电脑真的有鸿沟吗?可能没有。
AI通过跟人聊天收集他们的数据,收集社交媒体上人们对于画家的评价——这样做作品,人们会说好有创意;那样做作品,人们会说有点儿太保守了。久而久之它就会在网络中找到对于“新”的、对于“好”的、对于“有趣”的定义,也是蛮吓人的。
2016年,清华有一位教授由于父亲喜爱画画,于是便带了一个团队,研究全国美展。
第一层是所谓的关联,相关性。
第二层是干预,干预是通过对现实世界进行干预从而产生另外一些不同的状态,对外在世界进行改变。在这个层级中可以想到袁园老师说的什么是“新”?“新”就是改变了自己或者理解世界的方式。假设一件AI作品改变了人对世界、人对自己的理解方式,这件作品就具有因果能力,或者是因果效力改变了我们的世界。那么我们就可以说他创造了一个真正的艺术品和风格。
现在只是在初步的尝试和研究中,目前AI还是一个工具性的东西。当然即使是工具也有可能产生很大的灾难,比如艾希曼。
其实从很早就开始研究人机价值对齐这个领域了——让AI意识到人类的价值,学习人类的价值观、审美、行为方式等等,并且将其作为AI本身的行为方式来处置。这种AI目前还没有大规模应用,但如果应用,不用事后审核,仇恨和极端等内容自然而然就减少了;同时在和这种AI进行协同和交流时它也会理解我们的价值,甚至理解我们所说的语境或是审美。
也许艺术也是同样,你在画布之中永远无法做出新的东西,但是在画布之外可以;也许最终反映的结果依旧是在画布上,但是来源是画布外的一次绝食、一次苦修、一次失恋或是一场社会的变革。
我理解的所谓的“创新”或者是新风格,应该是外部或是上层场域的改变反映回了本身的场域。
【往期回放】
1 | |
2 | |
3 | |
4 | 讲座文稿:开放的作品与元宇宙“再进化”的游戏潜能 | 加密艺术与元宇宙NO.12 |